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flKt^^^f ™"° n ^ P erformances d '"n Systeme multiprocesseur comprenant une 
file d attente de tmvaux et architecture de systeme pour la mise en oeuvre du pJc^de 



(57) L'invention concerne un procede d'affectation 
de taches dans un systeme de traitement de donnees 
numeriques muttiprocesseur a systeme Sexploitation 
preemptif et une architecture pour la mise en oeuvre de 
ce procede. Le systeme comprenant des processeurs 
(200-203 et 210-213) susceptibles de traiter les taches 
en parallele repartis en groupes (200-201, 202-203) 
Une file d'attente elemental (5 a , 5 6 ) est associee a 
chacun des groupes de processeurs (200-201 
202-203) et enregistre des taches a executer. Toutes les 
taches a executer (T, a r 10 ) sont enregistrees dans une 
table (4). Chacune des taches (T, a r 10 ) de la table (4) 
est associee a I'une des files d'attente (5 a , S b ) et chacu- 
ne des taches enregistrees dans les files d'attente (5 , 
5 b ) est associee a Tun des processeurs (200 a 201 ). Les 
associations sont effectuees par des jeux de pointeurs 
croises ( P200 a p 203 , PP 5 a , ppS^ pT v pT s , P r 10 , p 5al a 
P5a4. Psb\ a Psbio)- Dans un mode de realisation sup- 
plemental, selon plusieurs variantes, on procede a un 
(re-)equlibrage de la charge du systeme entre files d'at- 
tente §lementaires. 
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cesseurs a I'une des files d'attente 6lementaires. 

[0015] Cette disposition permet notamment de limiter le nombre de processeurs accedant aux verrous et done de 
lirnrter le phenomene de contention. 

[001 6] Cependant. ['experience montre que. lorsque le nombre de taches et le nombre de processeurs augmentent 
la disposition precise ne permet plus d'ameliorer les performances du systeme. 
[001 7] Ceci est du a plusieurs phenomenes et notamment aux suivants ■ 

[0018] Dans un systeme d'exploitation moderne existent deux types de taches : les taches a priorite variable et les 
taches a pnonte fixe. Les taches du premier type sont des taches dont la priorite varie en fonction du temps de pro- 
cesseur consomme (la politique d'ordonnancement est definie par le systeme d'exploitation lucerne). Les taches du 
second type sont des taches dont la politique d'ordonnancement est fixee lors de la definition de la tache par le pro- 
grammeur. r K 

[001 9] En premier lieu, la gestion des taches de priorite fixe dans un systeme comportant plusieurs files d'attente 
selon une premiere caracteristique du premier mode de Invention, peut devenir complexe, car il est necessaire d'eviter 
qu une premiere tache de priorite plus elevee soit executee apres une seconde tache de priorite moins elevee Cette 
gestion severe en effet difficile, et surtout couteuse en temps, lorsque les deux taches precipes sont dans deux files 
d attente dist.nctes. On conceit aisSment que cette difficulty augmente rapidement avec le nombre de taches qui se 
repartissent dans un grand nombre de files d'attente. 

[0020] Le probleme subsiste pour des taches de priorite variable, mais la difficult* de mise en oeuvre est moindre 
to 1 L S SySt6m ! f exploi,ation ""-mame qui fixe les priorites, et il peut se permettre de violer ses propres regies 

[0021] En second lieu, le traitement des taches peut devenir des6quilibre. Les taches dtant. a priori, de nafures 
heterogenes. le temps necessaire au traitement de celles-ci peut varier dans de fortes proportions d'une tache a ("autre 
II sensu.t que un ou plusieurs processeurs. ou groupes de processeurs. peuvent se trouver en sous^harge voire 
devenir .nactifs. faute de taches a trailer (les files d'attente associ6es s'etant vid^es), alors qu'un ou plusieurs autres 
processeurs, ou groupes de processeurs, continuent de trailer des taches (voire etre surcharges) et qu'il reste des 
aches a executer dans les files d'attente associees a ceux^i. Aussi, dans un second mode de realisation prefere de 
I invention, tout en conservant les dispositions propres au premier mode de realisation (partition des files d'attente) 
on procede a un reequilibrage du traitement des taches, selon plusieurs variantes 

[0022] Selon une premiere variante, le r66quilibrage comprend une repartition optimist des taches entre les diffe- 
rentes files d'attente du systdme. Le mode de repartition tient compte de differents param6tres qui seront praises 
dans ce qui suit. La repartition peut etre effectu6e. soit lors de la creation de la tache. soit lors de ('association realisee 
entre la tache et un fichier contenant le programme a ex6cuter. 

[0023] a litre d'exemple, dans un environnement de type "UNIX" precite. cette association est realisee par une ins- 
truction de type : execQ'. Cette seconde option est preferable lorsque le systeme multiprocesseur est du type "NUMA' 
precite. 

[0024] Cette disposition am6liore les performances du systeme, y compris lorsque le nombre de taches a trailer est 
res eleve. Cependant, la courbe representant les performances presente des oscillations, qui traduisent des instabi- 
lity, notamment lorsque le nombre de taches devient eleve. En outre, il est encore possible d'ameliorer les perfor- 
mances. r 

[002S] Selon une deuxieme variante de realisation du second mode, lorsque la file d'attente associee a un proces- 
seur, ou a un groupe de processeurs, devient vide et que le processeur ou au moins I'un des processeurs n'a plus de 
tache en cours de trartement. le processeur recherche dans les autres files d'attente s'il existe des taches en attente 
de trartement. S. cette recherche est positive, dans un mode pr6fer6, le processeur recherche ce qu'on pourra appeler 
a meilleure tache a trailer-, s'il existe plusieurs taches en attente. Le mode de recherche et de selection de cette 
tache sera precise dans ce qui suit. 

[0026] On doit bien comprendre que dans ces deux variantes, ('affectation des diff6rentes taches aux differentes 
files d attente reste mchangee. L'association des premiere et deuxieme variantes prScitees est particu liarement efficace 
pour I amelioration des performances du systfeme tant que de nouvelles taches se cr6ent en permanence Par contra 
lorsque cet etal cesse, par exemple en fin de travail du systems, on peut etre amenS a constater de nouveau des 
d6s6quilibres de charge. 

t0 ° 27 L AUSSi> rinvention P eut comprendre une troisieme variante de realisation, dans laquelle on reaffecte des taches 
entre differentes files d'attente, de facon periodique par exemple. 

[0028] Cette disposition n'a g^nSralement que peu d'effet en regime normal (creation continue de taches) sur les 
performances d un systeme multiprocesseur symStrique, e'est-a-dire du type n SMP° precite. Elle peut cependant seve- 
rer utile pour un systeme de type "NUMA" precrte. 
ss [0029] L'invention a done pour objet un procede d'affectation de taches dans un systeme de traitement de donnees 
numenques multiprocesseur, a systeme d'exploitation preemptif, comprenant un nombre determine de processeurs 
suscept.bles de traiter lesdites taches en parailele, caracterise en ce qu'il comprend au moins une phase preliminaire 
pendant laquelle lesdits processeurs sont rdpartis en groupes, chaque groupe comprenant des nombres predetermines 
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%^Jl!l n * € ZT*f* ?° VSrrOU ' 6St Uti " S6 danS Un CSrtain nombre de circonstances. pour eviter un acces 
concurrent a une tache. et nolamment lorsqu'une tache est ajoutee ou retiree de .a file d'attente 5. ou lorsqS„e change 

SSUf ,r° n °° "P 0 " ais6ment que ce m acanisme de verrou global soit generates de contentions lorsqu'il est f reauem 

^ZZ^ZfiZS?" ,aible sca,abi,it6 Cet inconvenient est amp,ffie ,orsque ,e s^^S— 

^llJn^.Tr? u H ne H Ca : ac,eristic > ue importante de Pinvention. dans un premier mode de realisation on prevoit 
et deCous UmqUe - " dSS V8rrOUS qUi ,Ui SOnt associes ' en P' usieur s rambles deli'.e daZe 

S2SS™J, Ure . 2 i,IUStfe SCh6malic ' uement un temple d'architecture de ce type. Le systems 1 comprend comme 
2^T^' P S pr °f eSSeurs Ce Pendant. ces processeurs ont ete rassemb.es en groupes de processes 

non 2 ~. ^c 1 " 5 ? ^ 8re T 6S ° a * G - ChaqUe 9rOU P e - G * a G c Peut comprendre un nombre Spue ou 
non de processeurs. Sur la f,gure 2. a titre d'exemp.e. on a suppose arbitrament que le groups G comprenaJ deux 

fW431 Pn'ou^ 6 ' 2 > 16 9fOUPe tr ° iS P fOCesSeu ^ 2 °* » 22. et le groupe G " un seul pVocesseur 20 
eTJL^lT' P . fem,ere carac,eristioue importante de Invention, la file d'attsL unique figure 1 5) 

2a?au nTmL de n^n" ""h P ^ * d " a,ten,e - ° e ,a? ° n P lus P rac,se encore ' le nombf * °° «•« dattente e S 
JS^J T 9 P , dS processeurs - soi « trois files d'attente dans I'exemple de la figure 2 : 5 a a 5 chaque file 
d attente etant associee a Tun des groupes de processeurs G a G ■ °* a :> c , cnaque file 

ES. »X°S?,l a 2r n 3U,re aSPSCt imPOr,ant ' ChaQUe T1 * ^ SSt a " eC,6e 3 Une «'* d ' at ^ e 

fa?d 4 e 5 de £ aSS ° Ciati ° nS S " effeCtUen ' ^ ' ^ ^ ^ ^ de '* fi 9" e 4 ' * 

bTLlt™ h U n ° mbre 1! 9r ° UPeS dS P rocesseurs ' done du nombre de files elemental, depend de nom- 
breux parametres dans un systeme multiprocesseur de caracteristiques donnees. Genera.ement, cette repartftion ne 
S ■ ! U ° d ° S Ca ' CUlS P r6alables . ™is par .'experimentation et la mesure. P 
e^Lit^ die, 9 K 9 ^ , ; inV0ntiOn SSt d'augmenter les performances globa.es du systeme par le biais d'une meilleu- 
une S2^2L TZ I prOC6SSeUrs individue.s. Aussi, les experimentations et tests precites consisted Ins 
une phase nmale, a defin.r des programmes de test et de reference, dits -benchmark" se.on la terminology anq.o 
saxonne. et de .es fa.re executer par .e systeme. La repartition des processeurs en groupes 
d attente e.emen.a.res donnant les meiHeurs resu„ats. d'un point de vue performances est retenuta ce ^de La 

S& ^Te"S'a e L U ur:lr/ ralement ' 9 ° l * 6 ' « ^ P ° Ur ' SS SyS,6meS de m§ ™ structure 'abriques pa fa suite 
urVSiL h LSL. /! h P^ esumer W a pr/on. les meilleures performances devraient etre atteintes en associant 
une file dattente a chacun des processeurs. En d'autres termes, chaque groupe serait reduit a un seul Dr^eSlur 
2^™" P eut en 9 endrer difficultes de realisation. Aussi, un compromis ^V^i^SSS 
rtLe?se7onTSn deCrire * ^ P ' US detai " ee ^ ^ ™ d * de du P«-SS & 

SSJSntf ependant ' C ° mme " a §t6 indic ' u6 ' les architectures des systemes multiprocesseurs du type "NUMA" ac 

.r^z^TsZ ce cadre et rappe,er b — ies asr^ 

a^nomh^^™ t -f djV f Gn m ° dUleS ' Par 8Xemp,e 60 deux modules ' H et Mi com ^ represente sur la figure 
Luln^notio q ,!if CO r? qUe) ' ChaqUS m0dU,e ' 8t **«■ com P rend u " «^bre quelconque de processeurs 

fqu^e ^i?3e? 2 P ^ 

w ' ^? 3 " res P ectlv ement. En effet. lorsque le nombre de processeurs en paralle e auamente 

n?m P bT Q r u^ n r o S ,^ ^ SyS,6me 9 ' 0bal au 9 mentent d 'abord sensib.ement lineairement. puis ZSZStSSSFS 
^nnl^LT^TT X ° Sn 9en6ral UOe V9leur ° ptimale Les P^esseurs de chaque module, 1 e tZ s£ 
nZ* !rLTl m ,mem , e L aUX m0dUl6S ' 60 St * res Pa<*vement, et chaque module comprend notammen. une 
memo.re centra.e, Men^ et Mem v Les modules, M 0 et A*,, et leurs memoires associees Mem, et Mem formem 
chacun un sous-systeme de type "SMP" orecite i «e m „H ,i oc . ■•• oao - mam o el Mem v > ome ™ 

eu =.£r™> ^ Q ^ » precue. Les modules, Mq el M v sont relies entre eux par un lien L et un 

SStT ? ' 1 ° 2 ' qU ' Cons,ituen, un Prolongement des bus internes precites 

a^n moduli 0 o» 50,t a ' Sement qUS ' P3f SXemp,e ' la lec,ure ou ,,ecritu ^ d'une donnee de ou dans une memoire externe 
faooodfla mrme3^ eSSeU ; dS ** ** UadUiSe par Une d ag-dation des performances duTy^mf par 

rapport a la memo operat.on ent.erement execu.ee a I'interieur d'un meme module. Les performances sont eqalemen 

:rs:c; :rr r d<un modu,e * rau,re par ,e ,ien - - - »«^~ 

[0053] Aussi, on a propose des procedes permettant d'obvier tout ou partie des probldmes specifiques coses oar 
es arch.tectures de type NUMA", procedes qui sortent du cadre precis de .'invention. * ' P 

^11 Tfr^ , PrOCed6 dS '' inven,ion - da ns son premier mode de realisation, puisqu'il permet de limiter les 
contends, du fart de ,a part.tion des files d'anente e, des verrous associes. trouve une apl^pln^ZeM 
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chacune des files d'attentes, respect ivement 5„ et 5 b : T V T 2 et 7V T 4 pour la file d'attente 5 et T a T fi t r „ 

Wi'ssr- en " 8 *• ™* - * rsMi — 

[0069] Comme . I a ete rappele. il exists des laches a priorite fixe et des taches a priorite variable Pour les laches 

, a,fe ' ° n P8Ut f6serVer Une fi,e d ' atten,e au * ,acne * a P"onte fixe. Toutefois cette 

t r P rSesseu ^EI^??*- ' 8 ^ P>r 6Xemp,e '° rSqU ' Un processus comprend des 
a un processeur donne. La tache do.t alors res.der dans la file d'attente associee a ce processes ou au qrouoe auauel 

il appart.ent. L'ordre des priorites est traite a I'interieur de cette file d'attente d 
[0070] En resume de ce qui vient d'etre decrit, le precede selon I'invention. dans le premier mode de realisation oui 

zzzis r t,p, r ? fiies d * a,,eme ' * affecter * « d.?^s^^rSE5S 

chaque tache a une f.le d'attente permet bien d'ame.iorer les performances globa.es du sysieme En effet es conten 
tions sent reduites, car les verrous sont egalement distribues 

Affinilv" s^ZteiSonf/ 6 ^ 91, archi,ecture de ( yP e "NUMA" d'implan.er un mecanisme dft de "Weak 

Tr I S term.nolog.e anglo-saxonne. Un tel mecanisme favorise I'execution d'une tache sur un processeur 

2^ n qU6 ' ^ qU ' Perm6t de tirer Un P ' US grand beneficie de la mamoi 'e ^che dite de "nivea 3" assocfi 

i ? U 'T 8St P0SSib ' e d ' aSSOCief Une file d ' attente a des P^esseurs appartenant a un seul modulele 

distnbuteur peut a.sement confiner les taches d'un processus dans un seul module 

^IfL^ Pf H C6d6 Se '° n 16 PrSmier m0d8 de r6alisation tr °"ve cependant des limites lorsque le nombre de taches 
"-SK^Snr^STTT f ° rtemem - ^ effel ' ,0fS dS 13 Cr6a,i ° n "P^ique'd'une Scne celfe^doi 
0 Sent i a H Znlll Z r T . ^T™' ™ USa " d ' Un mtenisme de distribution donne. Jusqu'a 

.Jmnnl T ,mpllcrtement * u * la distribution des taches etait realisee sur une base d'equi-repartrtion 

temporelle entre les d.fferentes files d'attente. dans la mesure ou elles ne sont pas pleines Pour ce faire on oeut 
ut,hser un a.gonthme bien connu du type "round robin", e'est-a-dire a tour de r6le Une telle methods n'est pas sans 
.nconven.nts. En effet. dans les conditions precitees. les .aches pr6sentant des caracterisTques no homogenes 
notammen. en ce qui concerne le temps de traitement necessaire, il peut arriver qu'une ou piusieurs files d'attente 
scent vries ou peu chargees, et done que les processeurs des groupes qui leur sont associes soien. en souslharal 
vo,e ,nact,fs pour le moms jusqu'a .'apparition de nouvelles taches e, a .eur affectation a ces files SlS^Sl 
inverse une ou plusteurs au.res files d'attente peuvent presenter des surcharges importantes II apparait done un 
phenomena de desequi.ibre de charges, qui a d'au.ant plus de chance de se proSuire que le nomb e de fi e dt n 

; r 0m t b, H e *?" 3 1rait t r S ° m 6,ev6s ' L ' a "9™ntation escomptee des performances g.obales du system est 
siuM :tf P H a 7 e P ^ non ; 6ne parasite - Dan * cas particu.ierement defavorab.es. SrtZSTdE 

IT£T o r 9 ! ^ T >] qU ' d6p8nd dSS resso " r ^s propres a un systems particulier, i. arrive de constater 
que les disposmons du precede de I'invention sont contre-productives. en ce sens que les perfo marces du svsteme 

ssirssrs que celles ? n t ys,6me de rart connu pr§sen,ani ,es m§mes ress ° urces >"£™Ces y 

™ IL£ h h T S6COnd m ° de dS r6alisation ' mode de realisation prefere susceptible de piusieurs variantes 
n at 2 ,e d6S d,s P° s,t,ons ^PPIementaires permettan. un (re.)equi.ibrage de la charge entre les different £ 
d attentes, ou pour le mo.ns un traitement optimise des taches reparties dans les files d'attente. de manie e a ce que 
les processeurs so.ent ut.l.ses de facon optimises On doit bien comprendre cependant que, selon ce second mode 

rLZulT • tOU,eS VariantSS " 163 dis P° sitio - P-P-s au premier mcSje sont conserve Notammem on 
repartit les processeurs en groupes (qui peuvent coincider avec une repartition en modules dans un s^teTe d arch, 
ecture de type "NUMA") et on prevoit piusieurs files d'attente, une pargroupe de processeurs ' 3 Ch " 

f S ° pera ! IOn t S necess ai^s pour obtenir cette configuration a files d'attente multiples, generalement effec- 
ts un 1 1 Zn t P ° Ur i OUt " S ' cons t^^t done une phase^ue ,'on pourra qualifier de preliminaire. En mode opTa, ionne. 
un (re-)equ. hbrage des taches entre files d'attente ou de la charge de travail entre processeurs va etre obfenuTelon 
a uT,^To niSm ! S ' C ° nS,i,Uant pr6cis6ment trais va " a "tes du second mode de reaction. .1 del, dS iTs Tre 
que ces tro,s mecan^mes peuvent coexister et ne sont pas exclusifs run de I'autre. Tout au contraire dans un mSe 
d VT < L ° n C , UmU,era CSS trOIS m6canis ^, pour le moins les deux premiers qui donnentles me!£E 

so ™f S qUant 3UX 0bjeCt " S P° ursuivis P ar invention, comme il le sera precise cypres 

£ ] * 'f 9T ^ bTe VaHante de rea,isa,ion ' un Squilibrage des taches est obtenu en les rSpartissant de facon 

opt m,s«e entre les drfferentes fi.es d'attente .orsqu'e.les apparaissen. "physiquement". e, non plus simp^em a tou" 

f42f ( I J PreC ' te) ^ ta5 ° n Pr6ciSS de Ch0isir une file d ' attente va P*™*° cypres 

S, T f dS " X,eme Varian,e de ^'isation, un reequilibrage du traitement des taches est obtenu en optimisant 
lutd.sat.on effective , dee processeurs. Lorsqu'un processeur detecte que ,a file d'attente qui lui est assoSee Z vfde 

2o?nn'L n 3 P « ! . T ?° UrS dS ,rai,6ment ' " Va Chercher une »*• a ^ dans une autre file d'attente Te 
Innf T T ya9e ^ aUtr6S ,NeS d ' a,,en,e du s V st6me ' i us d u ' a ce trouve une file d'attente non 
SLlnni ar9S S , UpeneUre - 3 ***^ a un determine. Le choix d'une tache precise dans la file d'atteme 
se.ect.onnee. s effectue selon un processus qui va etre detaille ci-apre S . De fagon pratique, e'est le "dispatcher" qui 
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aussi cafculee a chaque fois qu'une instruction d'executton est initiee 

S^^^V^^x 88 ' Vaflab,e COmP ° Site ""P™*"' das constantes (cost charge CPU at 

[0092] Ces d.spositions presenters de nombreux avantages, notamment les smvants : 

a/ enes permanent de repondre «res rapidemen, a des modifications ega.ement rapides du component du sys- 

^ess^s*^ : n pourra " inc,ure d,autres variabies ' ^ * , a ch arge de 

d/ le desequilibre dans des modules materiels est automatiquement pris en charge (c'est-a-dire le nombre d e 
processeurs et/ou la taille memoirs) : en effet le nombre de processes est pris en compVe du f a J auele 

systems est moins performs qui syJ^XCT^nZ " ^ * ~ POr,, '° nS de C ° Ufbe ' '* 

^^0"^^ * " " -on mention. ,ors- 

autretache executable dans une liste diC^^ * qU '' de * ,ent inac,if ' va chercher une 

a un seuil determine. Dependant Is tachel select '1 X ^ ^ ?** '* taUX de Char9e SSt SUp<kieur 
qui vont etre precises ci-apres. ^elecfonnee ne peut etre quelconque. E.le doit repondre a certains criteres 

Sterne TZ^IT "^^T 1 m ° dQ *° ^ ChS P° SSibte d " une tache da - d'attentes 
qu-en tLnTque d e b e s oT C ° mmUnS ^ ^ las - seront re^ecrfts 

52 pa^T P r^^ *• - -r esseurs 6me,,en ' des 

uppose ici que la file d attente 5 q du processeur 2 q est vide et que celui-ci devient 
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[0110] En ce qui concerne le choix d'une tache, un grand nombre de facteurs doivent etre pris en compte et oarmi 
lesquels les suivants . K ' r a ">" 

V I'affinit6 avec un processes, c'est-a-dire le fait que la derniere distribution de la tache s'est effectuee sur ce 
s processeur ; 

2/ I'affinite avec un module, dans le cas d'une architecture de type °NUMA°, c'est-a-dire le fait que la derniere 
distribution de la tache s'est effectuee sur ce module ; 
3/ la priorite affectee k une tache ; 
4/ la localisation de la tache ; 
*0 5/ le fait que la tache ait deja. ete "aidee" ; 

6/ le fait que le processus sort mono-tache ; 
II la quantite de memoire accedee par la tache ; 
8/ I'utilisation du processeur ; et 
9/ la duree de vie de la tache. 
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[0111] En ce qui concerne le facteur 3/ (priorite), il est preferable de "sauter" les tache de plus haute priorite c'est- 
a-dire les premieres taches dans la file d'attente "aidee". En effet, la probability est grande qu'elles soient prises en 
charge par un processeur local, du fait precisement de la haute priorite qui leur est associee, avant qu'elle puisse etre 
trai ee par le processeur eloigne. (.'utilisation d'un seuil predetermine semble etre une solution appropriee pour cette 
parlie du processus En outre, les taches de plus faibles priority sont generalement, en moyenne slalislique. des taches 
qui utilisent le plus le processeur. 

[0112] La determination d'une valeur de seuil est importante. En effet si la valeur de seuil est trop basse c'est-a- 
d.re que le nombre de taches sautees est trop faible, le mecanisme d'aide se trouve alors souvent en conflit avec le 
mecanisme standard de distribution des taches, c'est-a-dire le mecanisme commun a I'art connu. En sens contraire 
si le seuil est fixe h une vafeur trop haute, aucune tache ne pourra etre trouvee et le mecanisme d'aide s'avere com' 
pletement inefficace. 

[0113] De facon preferentielle : pour etre aussi independant que faire ce peut de la charge de travail on met en 
oeuvre un proced6 auto-adaptatif, par exemple le suivant : 

[0114] Le nombre de taches sautees est fixe a une valeur comprise entre le nombre de processeurs et le nombre 
de taches executables dans I'ensemble de file d'attente. Cette valeur est incr6ment6e d'une unite cheque fois que la 
tache cho.s,e pour etre "aidee" est, soil deja verrouillee. soil n'est pas a I'etat executable. Cette valeur est decrements 
d une umte chaque fo.s qu'aucune tache n'est trouvee, lorsque le nombre maximum de taches a balayer est superieur 
k la moiti6 du nombre de taches executables. H 
[0115] Le nombre maximum de taches a balayer est fixe a une valeur comprise entre I'unit6 et le nombre de taches 
executables dans .'ensemble de file d'attente. Cette valeur est increments d'une unite cheque fois qu'aucuneShe 
n est trouvee ou chaque fois que la tache choisie se trouve dans le dernier quart des taches balayees (taches de plus 
basses pnontes). Cette valeur est decrementee d'une unite chaque fois que la tache choisie se trouve dans le premier 
quart des taches balay6es (taches de plus hautes priorites) premier 

J~l ! aC,eUr 4/ J. loca,isa,ion ) est ^ a P"<>", un facteur tres important. Cependant, ce facteur est generalement 
d,ff.c,le ^ determiner, bien que, dans un environnement de type "UNIX", la localisation de la tache soit connue par 
segment de memoire. K 

[0117] En ce qui concerne le facteur 5/, on peut generalement admettre que, si une tache a d6ia ete "aidee" elle 
peut deja res.der dans plusieurs modules. II s'ensuit que de la d6placer ailleurs ne constitue pas une operation couteuse 
en terme de degradation de performances. 

[0118] En ce qui concerne le facteur 71, il s'agit 6galement d'un facteur important, mais qui ne peut etre determine 
a.sement. Deux cr.teres permettent d'arriver a une approximation raisonnable : 

a/ la taille memoire utilis£e par le processus ; et 

b/ "I'interactjvitd" de la tache, ce critere etant defini par le fait qu'une tache soit souvent "dormante" ou non. 

[0119] Le critere b/ peut etre obtenu a partir d'un comptage du nombre de fois ou elle est a I'etat "dormant" ce qui 
peut se denver de statistiques generalement disponibles. ' 
[0120] En ce qui concerne enfin le facteur 9/, il est ais6 de comprendre qu'il n'est pas utile de tenter de prendre en 
charge les taches de faible dur6e de vie. En effet, la plupart d'entre elles disparaissent a court terme 
[0121] En tenant compte de tout ou partie de ces differents facteurs, il est possible de determiner quelle tache doit 
etre s6lect,onnee dans une file d'attente, en d6finissant un cout individuel associe a chaque facteur, et d'en d6duire 
un cout global associ6 & une tache particuliere. On peut, pour ce faire construire une table h deux entrees ■ facteurs 
- couts. La tache presentant le cout global le plus faible est selectionnSe. c'est^-dire celle causant la degradation 
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" < mi ,rOUVef 13 d ' atten,e d ' indiCe 3rbitraire y P ° Ur laqUe " e 16 P aram6 »^ WUTP . aD& est 

- migrer ce processus vers I'ensemble de file cfattente le moins charge 5„ • et 

" gg™ J g£ ^ ct euigpresentatif du desequilibre des deux ensembles de file cfattente. sort W x = a3 x - 

Sts L8 V6CteUr ^ Char96 C ° mPOSite SSt U " V6CteUr * ,f0iS dimensions - ^ effet. i. depend des parametres 

charge du processeur ; 
charge de la memoirs ; et 
priorite. 

SSL d H UX PrSmi ! rS parametres dependent a leur tour de la configuration materielle et logicielle precise du 
systems cons.dere : nombre de processeurs. taille de la memo.re. nombre de pages memoirs libres etc La determ, 

TZt T« Param6 : reS - C ° mmUne * ''^ C ° nnU 6t ° btenue ^ des calculs'cfassiques, bfens conn s de tal 

T S ST ° btenU * Partir dS 13 m ° yenne d6S prioritas a,,acbaes aux ^ifferentes , aches 
SlrS T h<tor,quemen ' ,a ^termination de la charge dun ensemble de file cfattente est donnee par la somme des 

It! P ^!! 8US H MaiS P ° Ur 3CC6l6rer Cet,e ^termination, on la derive directement a partir de statistics ol 

oara^l T h * S,fUC,Ure * de Cet enSemble - ^ char 9 e d6 P end * "ouveau de trot 

parametres charge du processeur, charge de la mSmoire et priorite 

[01 37] La determination de la charge composite moyenne peut Stre obtenue a partir de la relation suivante : 

,aqUe " e "* * C ° mP ° Si,e dU dS d * at,ente * P le nombre total "'ensembles de 

[01 38] Le desequilibre moyen peut etre determine* a partir de la relation suivante : 



J5 t =AD. + $fL-ACL,) (4) 

S!2L La t d !. te . rn ; ination du co0t associe a "ne operation de migration peut etre obtenue en considerant que le cout 
pr.nc.pa est du a la m.grat.on de pages de memoires. dans un environnement de type "UNIX" (ou E a des 
mZ °'? aU ? 3U d6placement d ' une «*• d '"n ensemble de file d'attente a un aJre 

n^!L ? app ;° Ximat ' on de ''estimation du cout est obtenue directement par le nombre de pages associees au 

Sx" TJ^lll ^ ^ heS d8Vant * w d6pbc6es - Dans un ^vironnement autre que IwSnernent 

m S X ' P 96 dS memoire doit etre remplaca par une entite equivalente 

SI J n.ff m0d6S d f d6termination des Parametres impliques ne sont precises qu'a titre d'exemple, pour fixer les 
.dees. D autres alternates existent et sont a la portee de fhomme de metier 

SdSn- 8 ' ° n 86 rep0r,e , d f ,? OUveau a la "9 ure 8 - ,a co "*e C c illustre schematiquement failure de l'am6lioration des 

ZaZ Z Par r8PP " (C ° Urbe Q Ce P endant - ''experience montre que, dans le cas genSTam* 

ra I IOn n r°H e T raPP ° rt a K Ce " e ° b,enU8 Par ' a d6UXi6me Variante est P eu "nportante. Ceci est du essentSlem^nt 
f de P' a «^^t phys.que des taches entre files d'attente implique un cout non negligeable ce Z ^ 

con, ; « ! Pa f ^ nera " Se ' COn,0mr,ement au * dispositions pref6rentiel.es qui viennent d'etre rappelees ma7s au 
contra.re select*. On reservera cette varante du precede selon .'invention a une archrtecture de type "NUMA" car 
dans le cas d'une archrtecture classique de type "SMP", I'amSlioration des performances n'est pas significative alors 

mS HH^Zrll?* " TT dS ' r C ° nSXaXe alSemen, qUS |,inven,ion atteint bien les buts quelle s'est fixes. 
2^52 L . cependant que f.nvention n'est pas limits aux seuls exemp.es de reasons exp.ici.ement 

d6crits, notamment en relation avec les figures 2 et 4 k 8. «*P"cuemeni 
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de charge composite est calcule comme etant ta somme de la charge d'un processeur ou d'un groupe de proces- 
seurs assoc.e a lad.te f.le d'attente elemental et .a charge des moyens de memoire associes a ce processeur 
ou ce groupe de processeurs. M'ucesseur 

Procede salon la revendication 6, caracterise en ce qu'il comprend une etape prealable consistant a tester si ladite 
nouvelle tache (Tz) est l.ee a une desdites files d'attente elementaires (5 8 . 5, 5 y , 5J et en ce que to squeledit 
test est positif a aiguiller ladite nouvelle tache vers cette file d'attente elemental * q 

Precede selon I'une quelconque des revindications 1 a 5. caracterise en ce qu'il comprend au moins une phase 
supplemental constant, lorsque Tune desdites files d'attente elementaires (5J associee a run desdits croupes 
de processeurs (2,) est vide de taches executables. a rechercher une file d'attente elementaire (5 ) dite eloiqnee 
non vide et dans cette file d'attente elementaire ( 5/ ) a selectionner une tache executable par fun desdits ploces 
seurs (2 q ) dudrt groupe de processeurs associe a la file d'attente elementaire vide (5 0 ) et a la transmettre a ce 
'S sJsTe 3 me e ( U | r ) (2<?) **** * ^ * * 6qUMibre 9l0balemer1, ,e traitement desdites taches dans ledit 

10. Procede selon la revendication 9, caracterise en ce que ladite file d'attente elementaire non vide (5„) do.t presenter 
un seuil d'occupation minimal predetermine. y M>o&enier 

11. Procede selon la revendication 10, caracterise en ce qu'en outre, les taches etant enregistrees par ordre de priorile 
decro.ssante. un nombre predetermine de taches est saute avant de balayer les autres taches de ladite file d'attente 
elerr.enta.re non vide <5 y ) pour rechercher une tache executable et la faire trailer par I'un desdits processeurs (2 ) 
dud.t groupe de processeurs associe a la file d'attente elementaire vide (5,,). Q 

Precede selon la revendication 11 , caracterise en ce que ledit nombre de taches sautees et le nombre maximum 
de taches balayees parm. toutes celles enregistrees dans ladite file d'attente elementaire non vide (5 ) sont va- 
riables dans le temps et sont determines par un processus auto-adaptatif a partir du nombre de taches trouvees 

ZZSEZ v^'Iv layases * de la P,ace de ces ,aches c,assees par ordre de priorit6 dans ,adite fi,e 

Procede selon I'une quelconque des revendications 9 a 12, caracterise en ce que ladite tache selectionnee est 
ceMe assoc.ee k une valeur minimale d'un parametre dit de cout, mesurant la degradation de performances globale 
dud,t sys erne (1 . due au traitement de ladite tache selectionnee dans ladrte file d'attente elementaire eioignee 
non v.de (5,) par I un desdits processeurs dudit groupe de processeurs associe a la file d'attente elementaire vide 

14. Procede selon I'une quelconque des revendications 1 a 5. caracterise en ce qu'il comprend au moins une phase 
supplementa.re comprenant au moins une etape de mesure periodique d'une repartition equilibree desdites taches 

t^Z^T^^J 1 ^^ 66 (5a ' 5 " 5 r 5 >> St ' '° rS de 13 «*«"*»«« d'un etat desequilibre dudi 
systeme (1 ), une etape de deplacement selectif de taches d'au moins une file d'attente elementaire plus chargee 
(5,) vers une file d'attente elementaire moins chargee (5 ). ^drgee 
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15. Procede selon la revendication 1 4, caracterise en ce que. lorsque ledit desequilibre est inferieur a un seuil deter- 
mine, aucun deplacement de tache n'est realise. 

16. Procede selon les revendications 14 ou 15, caracterise en ce que tout ou partie desdites taches apparlenant a 
des processus multitaches, chaque processus multitache necessitant une taille de memoire et une charge de 
travail determ.nees, il comprend une etape de mesure desdites charges de travail et desdites tallies de memoire 
en ce qu .1 comprend la selection du processus necessitant la plus forte charge de travail et la plus faible taille de 
memoire, et en ce que ce que toutes les taches dudit processus selectionne sont deplacees vers la file d'attente 
(H<§mentaire la moms chargee (5 y ). 8 

17. Procede selon la revendication 1 6. caracterise en ce qu'il comprend une etape preliminaire consistant a tester si 
toutes les taches dudit processus multitache devant etre deplacees appartiennent a ('ensemble de file d'attente 
elementaire le plus charge (5 X ) et si aucune tache n'est liee a I'un desdits groupes. 

18 ' Tn^nf -n^v-'T 6 qUe '^ nqu ! d x es vesications 1 a 17, caracterise en ce que .edit systeme d'exploitation est 
du type "UNIX (marque deposes). 
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